استخراج خودکار معادل‎های واژگانی از پیکره‎های دو زبانه موازی

نویسندگان

طیبه موسوی میانگاه

دانشیار گروه زبان شناسی دانشگاه پیام نور مهشید شکیبا

کارشناس ارشد گروه کامپیوتر دانشگاه پیام نور

چکیده

امروزه به مدد ظهور انواع فناوری های رایانه ای، پیکره های زبانی نقش بسیار مهمی در حل انواع مختلف مسائل زبانشناختی ایفا می‎کنند. پیکره های دو زبانه موازی در سطح جمله و در سطح واژه می‎توانند برای بازیابی واحدهای تک واژه ای و یا حتی چند واژه‎ای براحتی مورد استفاده قرار‎گیرند که این امر کاربردهای مفیدی در حوزه‎های مختلف رایانه و زبان خواهد‎ داشت. هدف این مقاله به کارگیری یک پیکره موازی انگلیسی– فارسی از‎قبل طراحی‎شده در‎جهت ساخت یک مطابقه[1] (کشف اللغات) دو زبانۀ کارآمد با‎ استفاده از آمارۀ اطلاعات متقابل است. در اینجا از آماره اطلاعات متقابل استفاده می‎شود تا همترازی در سطح واژه بین جملات انگلیسی و فارسی پیکرۀ مورد ‎نظر صورت‎گیرد. یک پیکرۀ زبانی همتراز شده در سطح واژه مسلماً کاربردهای زیادی از جمله در تهیه نرم‎افزار حافظۀ ترجمه، مدیریت مجموعه اصطلاحات، بازیابی اطلاعات دوزبانه، سیستم ترجمه ماشینی مبتنی ‎بر‎آمار و مانند آن دارد. با استفاده از یک الگوریتم ابتکاری آزمایشی ترتیب‎ داده ‎شده و مقایسه‎ای بین برونداد همترازسازی خودکار با جملات همتراز‎شده توسط مترجم انسانی صورت‎گرفت. نتایج این آزمایش نشان‎ داد که برنامه مطابقه گزارش شده در این تحقیق می تواند صحتی معادل 75‎ درصد را به دست آورد. [1] concordance

برای دانلود باید عضویت طلایی داشته باشید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

تداخل واژگانی دو زبانه های تالشی ـ فارسی و فارسی ـ تالشی

افراد دوزبانه به­دلیل ضعف در برقراری ارتباط به زبان دوم، ناخواسته عناصری را از زبان نخست به زبان دوم انتقال می­دهند تا ارتباط برقرار شود. این مسأله در زبان­شناسی اجتماعی و علم آموزش زبان تداخل زبانی نامیده می­شود. برای رسیدن به نتیجۀ مطلوب آموزشی در جامعۀ چندزبانه­ای مانند ایران که از زبان فارسی برای اهداف آموزشی استفاده می­کند، بررسی نتیجۀ برخورد زبان­ها، تداخل زبانی و دوزبانگی بسیاری از مسائل...

متن کامل

استخراج خودکار عبارتهای کلیدی از متون مقاله‌های فارسی

در پژوهش حاضر، عبارتهای کلیدی از متون مقاله‌های فارسی به صورت خودکار جداسازی گردیده است. استخراج عبارتها مبتنی بر روشهای آماری، نحوة توزیع واژگان، مجاورت و ... صورت پذیرفته است. سیستمی که بر پایه پژوهش حاضر طراحی گردیده، با توجه به بازخوردهای کاربر از قابلیت یادگیری برخوردار است، با توجه به بازخوردهای کاربر از قابلیت یادگیری برخوردار است، به گونه‌ای که در طول زمان مرتباً به کارایی آن افز...

متن کامل

بررسی توانایی های زبانی کودکان دو زبانه سندرم داون در دو سطح نحوی و واژگانی

کودکان داون کودکانی هستند که دارای ناتوانایی های شناختی و زبانی ناشی از نوعی اختلال کروموزومی می باشند. این اختلال کروموزومی یکی از رایج ترین اختلالات رشدی است که منجر به آسیب دیدگی ذهنی می گردد. مشکلات یادگیری زبان، به ویژه مشکلات بیانی و گفتاری، در کودکان سندرم داون مشخصه مهمی محسوب می شود. بسیاری از کودکان مانند کودکان طبیعی در محیط های دوزبانه متولد می شوند و رشد می کنند. این پژوهش بر پایه ...

15 صفحه اول

مقایسه تطبیقی یادگیری زبان انگلیسی دانش اموزان یک زبانه و دو زبانه دبیرستانی

کشور ایران حاوی مناطق جغرافیایی مختلف یک زبانه ، دو زبانه، و چند زبانه می باشد و در عین حال ، کلیه این مناطق دارای نظام آموزشی یکسان ، منجمله نظام آموزش زبان انگلیسی واحد در مقاطه راهنمایی و متوسطه می باشند . تحقیق حاضر که مشتمل برچهار فرضیه می باشد با هدف اولیه مشخص کردن آن که آیا تفاوت معنی داری در میزان یادگیری زبان انگلیسی یک زبانه ها و دوزبانه ها موجود است یا خیر انجام گرفت . همچنین هدف جا...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید


عنوان ژورنال:
پژوهش های زبان شناسی

جلد ۷، شماره ۲، صفحات ۱-۱۴

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023